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Verfahren und Vorrichtung zur Separierung von Schallsignalen 



Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Separierung von Schallsignalen. 

Die Erfindung liegt auf dem Gebiet der digitalen Signalverarbeitung zum 
Entmischen verschiedener akustischer Signale aus unterschiedlichen 
Raumrichtungen, welche mit zwei Mikrofonen in bekanntem Abstand stereo 
aufgenommen werden. 

Das Gebiet der Quellentrennung, auch „beam forming" genannt, erfahrt 
i/vachsende Bedeutung durch die Zunahme der mobilen Kommunikation sowie der 
automatischen Verarbeitung menschlicher Sprache. In sehr vielen Anwendungen tritt 
das Problem auf, dass das gewQnschte Sprachsignal (Nutzsignal) durch 
verschiedene Storeinflilsse beeintrachtigt ist. Hier sind hauptsachlich Storungen 
durch Hintergrundgerausche, Storungen durch andere Sprecher sowie Storungen 
durch Lautsprecherausgaben von Musik oder Sprache zu nennen. Die 
verschiedenen StOreinflusse erfordern je nach Ihrer Art und nach der Vorkenntnis 
uber das Nutzsignal unterschiedliche Behandlungen. 

Beispielhafte Anwendungen der Erfindung finden sich also in 
Kommunikationseinrichtungen, in denen die Position eines Sprechers bekannt ist, 
Jjnd in denen StSrungen durch Hintergrundgerausche oder andere Sprecher sowie 
Lautsprecherausgaben vorhanden sind. Anwendungsbeispiele sind Kfz- 
Freisprecheinrichtungen, in denen die Mikrofone z.B. im Ruckspiegel untergebracht 
sind und eine sogenannte Richthyperbel auf den Fahrer gerichtet wird. In dieser 
Anwendung kann eine zweite Richthyperbel auf den Beifahrer gerichtet werden, so 
dass wahrend eines Telefongesprachs gezielt zwischen Fahrer und Beifahrer hin- 
und hergeschaltet werden kann. 

In Fallen, in denen die geometrische Position der Nutzsignalquelle zu den 
aufnehmenden Mikrofonen bekannt ist, ist die geometrische Quellenseparation ein 
machtiges Werkzeug. Das Standardverfahren dieser Klasse von „beam forming"- 



Algorithmen ist das sog. „shift and add" Verfahren, bei welchem auf eines der 
Mikrofonsignale ein Filter angewendet wird, und das gefilterte Signal sodann zum 
zweiten Mikrofonsignal hinzuaddiert wird (siehe z.B. Haddad und Benoit, 
Capabilities of a beamforming technique for acoustic measurements inside a moving 
car", The 2002 International Congress and Exposition On Noise Control Engineering, 
Deabom, Mi, USA, August 19-21, 2002). 

Eine Erweiterung dieses Verfahrens beschaftigt slch mit ..adaptiven beam 
forming" bzw. ..adaptiver Quellenseparation", wo die Lage der Quellen im Raum a 
priori unbekannt ist und durch die Algorithmen erst ermittelt werden muss (WO 
^2/0671732, US6,654,719). Hier ist es das Ziel, die Lage der Quellen im Raum aus 
Ben Mikrofonsignalen zu bestimmen und nicht, wie beim „geometrischen" beam 
forming, fest vorzugeben. Adaptive Verfahren erweisen sich zwar als nutzlich, 
allerdings ist auch hier gewohnlich a-priori-lnformation erforderlich, da ein 
Algorithmus in der Regel nicht entscheiden kann, welche der detektierten 
Sprachquellen Nutz- und welche Storsignal ist. Nachteilig bei alien bekannten 
adaptiven Verfahren ist die Tatsache, dass die Algorithmen eine gewisse 
Adaptionszeit benotigen, bevor ausreichende Konvergenz besteht und die 
Quellentrennung gelingt. Aufierdem sind adaptive Verfahren prinzipiell anfalliger fQr 
diffuse HintergrundstSrungen, da diese die Konvergenz erheblich beeintrachtigen 
kSnnen. Ein gravierender Nachteil beim klassischen „shift and add"-Verfahren ist die 
.Tatsache, dass sich mit zwei Mikrofonen lediglich zwei Signalquellen voneinander 
Pseparieren lassen und die Dampfung von diffusem Hintergrundschall in der Regel 
nicht in ausreichendem Mafie gelingt. 

Es ist daher Aufgabe der Erfindung, ein Verfahren und eine Vorrichtung 
zur Separierung von Schallsignalen anzugeben, das mit nur zwei Mikrofonen mehr 
als zwei Schallquellen im Raum separieren kann, ohne die fur adaptive Verfahren 
typische Anfalligkeit for diffuse Hintergrundstorungen aufzuweisen. 

ErfindungsgemaR wird diese Aufgabe durch ein Verfahren nach Anspruch 
1 bzw. eine Vorrichtung nach Anspruch 8 gelost. Vorteilhafte Weiterbildungen der 
Erfindung sind in den jeweiligen Unteranspriichen definiert. 
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Das erfindungsgemafce Verfahren benetigt keine Konvergenzzeit und 
kann mit zwei Mikrofonen mehr als zwei Schallquellen im Raum separierbaren, 
sofern diese in ausreichendem MaBe raumlich getrennt sind. Das Verfahren stellt nur 

* 5 geringe Anforderungen an Speicherbedarf und Rechenleistung, und es ist sehr stabil 
gegenQber diffusen StOrsignalen. Anders als beim herkommlichen beam forming 
lassen sich solche diffusen Storungen effektiv dampfen. Wie bei alien Zwei-Mikrofon- 
Verfahren sind die Raumbereiche, zwischen denen das Verfahren differenzieren 
kann, rotationssymmetrisch zur Mikrofon-Achse, d.h. zu der Geraden, welche durch 

10 die beiden Mikrofonpositionen definiert ist. In einem Schnitt durch den RaUm, 

•welcher die Symmetrieachse enthalt, entspricht der Raumbereich, in dem sich eine 
fcchallquelle befinden muss urn als Nutzsignal betrachtet zu werden, einer Hyperbel. 
Der Winkel S 0 . den der Scheitel der Hyperbel zur Symmetrieachse einnimmt, ist frei 
wahlbar, und die Breite der Hyperbel, welche durch einen Winkel y 3 db bestimmt wird, 
15 ist ebenfalls ein wahlbarer Parameter. Mit nur zwei Mikrofonen lassen sich 
gleichzeitig Ausgangssignale zu beliebigen, verschiedenen WinkeJn £ 0 erzeugen, 
wobei die Trennscharfe zwischen den Bereichen mit dem Oberlappungsgrad der 
entsprechenden Hyperbeln abnimmt. Schallquellen innerhalb einer Hyperbel werden 
als Nutzsignale betrachtet und mit weniger als 3 db gedampft. Storsignale werden in 
20 Abhangigkeit ihres Einfallswinkels S eliminiert, wobei eine Dampfung von >25db fur 
Einfallswinkel £ aulierhalb der Akzeptanzhyperbel erreichbar ist. 

Das Verfahren arbeitet im Frequenzbereich. Das einer Richthyperbel 
zuzuordnende Signalspektrum entsteht durch Multiplikation einer Korrekturfunktion 

25 K2(x1) sowie einer Filterfunktion F(f,T) mit dem Signalspektrum M(f,T) eines der 
Mikrofone. Die Filterfunktion entsteht durch spektrale Glattung (z.B. durch Diffusion) 
einer Zuordnungsfunktion Z(d-S 0 ), wobei im Argument der Zuordnungsfunktion der 
berechnete Einfallswinkel S einer spektralen Signalkomponente steht. Dieser 
Einfallswinkel S wird aus dem Phasenwinkel 9des komplexen Quotienten der 

30 Spektren der beiden Mikrofonsignale, M2(f,T)/M1(f,T), ermittelt, indem man 9 mit der 
Schallgeschwindigkeit c multipliziert und durch 27tfd dividiert, wobei d den 
Mikrofonabstand bezeichnet. Das Ergebnis x1= (pc/27ifd, welches zugleich das 



Argument der Korrekturfunktion K2(x1) ist, liefert nach Beschrankung x=K1(x1) auf 
einen Betrag kleiner oder gleich eins den Kosinus des Einfallswinkels 0, welcher im 
Argument der Zuordnungsfunktion Z(3-S 0 ) steht; K1(x1) bezeichnet dabei eine 
weitere Korrekturfunktion. 

Kurzbeschreibung der Abbildungen: 

Fig. 1 zeigt die Definition des Einfallswinkels & durch die Positionen 
beiden Mikrofone, deren Signale verarbeitet werden. 
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Fig. 2 zeigt beispielhaft eine Zuordnungsfunktion Z(S) mit 
lalbwertsbreite 2y 3 db, aus welcher eine Hyperbei mit Scheitel bei S=0 resultiert. 



Fig. 3 zeigt eine Hyperbei mit Scheitel bei S=& 0 , die die 
15 Richtcharakteristik der Quellenseparation bestimmt. Signale innerhalb des durch die 
Hyperbei definierten Raumbereichs werden mit einer Dampfung <3db als Nutzsignal 
ausgegeben 

Fig. 4 zeigt den Aufbau des Quellenseparators, in welchem die 
20 Zeitsignale zweier Mikrofone, m1(t) und m2(t), in einer Stereo-Abstast- und -Fourier- 
Transformator-Einheit (20) zu Spektren M1(f,T) und M2(f,T) transformiert werden, 

•wobei T den Zeitpunkt der Entstehung der Spektren bezeichnet. Aus den Spektren 
wird in der d-Berechnungseinheit (30) der frequenzabhangige Einfallswinkel S(f,T) 
sowie das korrigierte Mikrofonspektrum M(f,T) berechnet, woraus in 
25 Signalgeneratoren (40) fur verschiedene Richtwinkel S 0 Ausgangssignale s&o(t) 
entstehen. 

Fig. 5 zeigt den Aufbau der S-Berechnungseinheit (30), in welcher der 
Phasenwinkel cp(f.T) einer spektralen Komponenten des komplexen Quotienten der 
30 beiden Mikrofonspektren M1(f,T) und M2(f,T) berechnet wird, welcher sodann mit der 
Schallgeschwindigkeit c zu multiplizieren und durch 27tfd zu dividieren ist, wobei d 
den Mikrofonabstand bezeichnet. Bei dieser Operation entsteht die GrSBe x1(f,T), 
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welche das Argument der beiden Korrekturfunktionen K2 und K1 darstellt. Mit diesen 
Korrekturfunktionen entsteht das korrigierte Mikrofonspektrum 
M(f,T)=M1(f,T)*K2(x1(f,T)) sowie die Grade x(f ,T)=K1 (x1 (f.T)). aus welcher durch 
Anwendung der Arcuskosinus-Funktion der Einfallswinkel 3(f,T) zu berechnen ist. 

5 

Fig. 6 zeigt einen Signalgenerator, in welcher eine Zuordnungsfunktion 
Z(S-do) mit einem einstellbaren Winkel So durch spektrale Diffusion zu einer 
Filterfunktion F(f,T) geglattet wird, welche mit dem korrigierten Mikrofonspektrum 
M(f,T) zu multiplizieren ist. Daraus resultiert ein Ausgangsspektrum S a0 (f.T), aus 
10 welchem durch inverse Fouriertransformation ein Ausgangssignal s 80 (t) entsteht, 

•elches die Schallsignale innerhalb des durch die Zuordnungsfunktion Z und den 
rinkel » 0 festgelegten Raumbereichs enthalt. 

Fig. 7 zeigt exemplarisch die beiden Korrekturfunktionen K2(x1) und 

15 K1(x1). 

Ein Grundgedanke der Erfindung ist es, jeder spektralen Komponente des 
einfallenden Signals zu jedem Zeitpunkt T einen Einfallswinkel 8 zuzuordnen und 
allein anhand des berechneten Einfallswinkels zu entscheiden, ob die entsprechende 
20 Schallquelle innerhalb einer gewQnschten Richthyperbel liegt, oder nicht. Urn die 
ZugehQrigkeitsentscheidung etwas abzumildern, wird anstatt einer harten Ja/Nein- 
(Entscheidung eine „weiche" Zuordnungsfunktion Z(S) (Fig. 2) benutzt, die einen 
kontinuierlichen Obergang zwischen erwunschten und unerwQnschten 
Einfallsrichtungen erlaubt, was sich vorteilhaft auf die Integritat der Signale auswirkt. 
Die Breite der Zuordnungsfunktion entspricht dann der Breite der Richthyperbel (Fig. 
3). Durch Division der komplexen Spektren der beiden Mikrofonsignale wird 
zunachst fur jede Frequenz f zu einem Zeitpunkt T die Phasendifferenz q> berechnet. 
Mit Hilfe der Schallgeschwindigkeit c und der Frequenz f der entsprechenden 
Signalkomponente lasst sich aus der Phasendifferenz ein Wegunterschied 
30 berechnen, der zwischen den beiden Mikrofonen liegt, wenn das Signal von einer 
Punktquelle ausgesandt wurde. Ist der Mikrofonabstand d bekannt, ergibt eine 
einfache geometrische Oberlegung, dass der Quotient x1 aus Wegunterschied und 
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Mikrofonabstand dem Kosinus des gesuchten Einfallswinkels entspricht. In der 
Praxis ist aufgrund von Storungen wie diffusem Storschall oder Raumhall die 
Annahme einer Punktquelle selten erfiillt, weshalb x1 gewohnlich nicht auf den 
erwarteten Wertebereich [-1,1] beschrankt ist. Bevor der Einfallswinkel d berechnetet 
werden kann, ist daher noch eine Korrektur erforderlich, die x1 auf das genannte 
Intervall beschrankt. Wurde zum Zeitpunkt T fur jede Frequenz f der Einfallswinkel 
S(f,T) bestimmt, ergibt sich das Spektrum des gewQnschten Signals innerhalb einer 
Richthyperbel mit Scheitel beim Winkel S=3 0 durch einfache frequenzweise 
Multiplikation mit dem Spektrum eines der Mikrofone, also M1(f,T)K(S(f,T> So). Unter 
Umstanden ist es vorteilhaft, K(S(f,T> S 0 ) vor AusfQhrung der Multiplikation spektral 
fcu glatten. Eine Glattung, deren Ergebnis als F M (f,T) bezeichnet sei, erhalt man z.B. 
Hurch Anwendung eines Diffusionsoperators. In Fallen, in denen durch StoreinflQsse 
die Grolie x, die zur Berechnung des Einfallswinkels dient, aulierhalb ihres 
Wertebereichs liegt, ist es vorteilhaft, die entsprechende spektrale Komponente des 
Mikrofonsignals abzuschwachen, da zu vermuten ist, dass sich StSrsignale 
Oberiagert haben. Dies geschieht z.B. durch Anwendung einer Korrekturfunktion, 
deren Argument die GrSUe x1 ist. Sei M(f,T) das korrigierte Mikrofonsignal, dann 
schreibt sich die Erzeugung des gewQnschten Signalspektrums inklusive spektraler 
Glattung und Korrektur als S d0 (f,T)=Fso(f,T)M(f,T). Aus S«,(f.T) ensteht durch inverse 
Fouriertransformation das Zeitsignal sao(t) fur die entsprechende Richthyperbel mit 
Scheitelwinkel & 0 - 

^ Anders ausgedrQckt ist es eine Grundidee der Erfindung, verschiedene 

Schallquellen, beispielsweise den Fahrer und den Beifahrer in einem Kraftfahrzeug, 
raumlich voneinander zu unterscheiden und somit beispielsweise das Nutz- 
Sprachsignal des Fahrers vom St6r-Sprachsignal des Beifahrers zu separieren, 
indem man die Tatsache ausnutzt, dass diese beiden Sprachsignale, also 
Schallsignale, in der Regel auch bei unterschiedlichen Frequenzen voriiegen. Die 
erfindungsgemali vorgesehene Frequenzanalyse erlaubt also zunachst, das 
Gesamt-Schallsigna! in die zwei Einzel-Schallsignale (namlich vom Fahrer und vom 
Beifahrer) aufzuspalten. Es mull dann "nur noch" mit Hilfe geometrischer 
Clberlegungen anhand der jeweiligen Frequenz jedes der beiden Schallsignale und 



der zu ermittelnden Phasendifferenz zwischen dem Ausgangssignal des Mikrofons 1 
und des Mikrofons 2, die jeweils diesem Schallsignal zugeordnet sind, die 
Einfallsrichtung jedes der beiden Schallsignale berechnet werden. Da die Geometrie 
zwischen beispielsweise der Position des Fahrers, der Position des Beifahrers und 
der Position der Mikrofone, etwa in einer Freisprecheinrichtung im Kraftfahrzeug, 
bekannt ist, kann dann das weiter zu verarbeitende Nutz-Schallsignal aufgrund 
seines anderen Einfallswinkels vom St6r-Schallsignal separiert werden. 

Es folgt ein detailliertes AusfOhrungsbeispiel der Erfindung, das anhand 
der Abbildungen beschrieben wird. 

^ Die Zeitsignale m1(t) und m2(t) zweier Mikrofone, die einen festen 

Abstand d zueinander haben, werden einem Rechenwerk (10) zugefiihrt (Fig. 4), wo 
sie in einer Stereo-Abtast- und -Fourier-Transformator-Einheit (20) mit einer 
Abtastrate f A diskretisiert und digitalisiert werden. Eine Folge von a Abtastwerten 
jeweils eines der Mikrofonsignale m1(t) und m2(t) wird durch Fourier-Transformation 
zum komplexwertigen Spektrum M1(f,T) bzw. M2(f,T) transformiert, wobei f die 
Frequenz der jeweiligen Signalkomponente bezeichnet, und T den Zeitpunkt der 
Entstehung eines Spektrums angibt. FQr die praktische Anwendung ist folgende 
Parameterwahl geeignet: f A =11025 Hz, a=256, T a/2=t. Wenn Rechenleitung und 
Speicherplatz es erlauben, ist jedoch a=1024 zu bevorzugen. Der Mikrofonabstand d 
^sollte kleiner sein als die halbe Wellenlange der hochsten zu verarbeitenden 
frequenz, welche sich aus der Abtastfrequenz ergibt, d.h. d < c/4f A . Fur die oben 
angegebene Parameterwahl eignet sich ein Mikrofonabstand d = 20 mm. 

Die Spektren M1(f.T) und M2(f,T) werden einer S-Berechnungseinheit mit 
Spektrum-Korrektur (30) zugefOhrt, die aus den Spektren M1(f,T) und M2(f,T) einen 
Einfallswinkel S(f,T) berechnet, der angibt, aus welcher Richtung relativ zur 
Mikrofonachse eine Signalkomponente mit Frequenz f zum Zeitpunkt T in die 
Mikrofone einfallt (Fig.1). Dazu wird M2(f,T) durch M1(f,T) komplex dividiert. cp(f,T) 
bezeichne den Phasenwinkel dieses Quotienten. Wo Verwechslungen 
ausgeschlossen sind, wird im folgenden das Argument (f,T) der zeit- und 
frequenzabhangigen Grolien fortgelassen. Die genaue Rechenvorschrift zur 
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Bestimmung von <p lautet gemad der Eulerschen Formel und den Rechenregeln fur 
komplexe Zahlen: 

9=arctan((Re1 *lm2-lm1 *Re2)/(Re1 *Re2+lm1 *lm2)), 

5 

wobei Re1 und Re2 die Realteile und Im1 und Im2 die Imaginarteile von M1 bzw. M2 
bezeichnen. Die Grdlie x1=<pc/27ifd entsteht mit Hilfe der Schallgeschwindigkeit c aus 
dem Winkel <p, auch x1 ist frequenz- und zeitabhangig: x1=x1(f,T). Der Wertebereich 
von x1 muss in der Praxis mit Hilfe einer Korrekturfunktion x=K1(x1) (Fig. 7) auf das 
10 Intervall [-1,1] beschrankt werden. Auf die so berechnete Grolie x wird durch 
nwendung der Arcuskosinus-Funktion ein Einfallswinkel d der betrachteten 
ignalkomponente errechnet, welcher von der Mikrofonachse zu messen ist, d.h. von 
der durch die Positionen der beiden Mikrofone definierten Geraden (Fig. 1). Unter 
BerOcksichtigung aller Abhangigkeiten lautet damit der Einfallswinkel einer 
15 Signalkomponente mit Frequenz f zum Zeitpunkt T: &(f,t)=arccos(x(f,T)). Des 
weiteren wird mit Hilfe einer zweiten Korrekturfunktion K2(x1) das Mikrofonspektrum 
korrigiert (Fig. 7): M(f,T)=K2(x1)M1(f,T). Diese Korrektur dient dazu, in Fallen, in 
denen die erste Korrekturfunktion greift, die entsprechende Signalkomponente zu 
reduzieren, da zu vermuten ist, dass sich Stdrungen Qberlagert haben, die das Signal 
20 verfalschen. Die zweite Korrektur ist optional, alternativ kann auch M(f,T)=M1(f,T) 
gewahlt werden; M(f,T)=M2(f,T) ist ebenfalls moglich. 

Das Spektrum M(f,T) wird zusammen mit dem Winkel S(f,T) einem oder 
mehreren Signalgeneratoren (40) zugefQhrt, wo mit Hilfe einer Zuordnungsfunktion 
25 Z(S) (Fig. 2) und einem wahlbaren Winkel S 0 jeweils ein auszugebendes Signal s s0 (t) 
entsteht. Dies geschieht, indem zu einem Zeitpunkt T jede spektrale Komponente 
des Spektrums M(f,T) mit der entsprechenden Komponente eines S 0 -spezifischen 
Filters F s0 (f,T) multipliziert wird. F 30 (f,T) entsteht durch spektrale Glattung von Z(S- 
S 0 ). Diese Glattung erfolgt z.B. durch spektrale Diffusion: 

30 

F»o(f,T) = Z(d(f,T)-S 0 ) + DA 2 f Z(d(f,T)-d 0 ). 
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Dabei bezeichnet D die Diffusionskonstante, welche ein frei wahlbarer 
Parameter grfllier oder gleich null ist. Der diskrete Diffusionsoperators A 2 f ist eine 
Abkurzung fur 

5 A 2 f Z(3(f,T)-3 0 )) = (Z(S(f- fA/a),T)-do)-2Z(&(f,T)-do))+Z(d(f+ f A /a,T)-S 0 ))/(fA/a) 2 . 

Der auftretende Quotient f A /a aus Abtastrate f A und Anzahl a der 
Abtastwerte entspricht dem Abstand zweler Frequenzen im diskreten Spektrum. 
Durch Anwendung des so erzeugten Filters F S0 (f.T) entsteht ein Spektrum 
10 S3o(f,T)=Fso(fJ)M(f,T), welches durch inverse Fouriertransformation in das Zeitsignal 




; 30 (t) ubergeht. 



Das von einem Signalgenerator (40) auszugebene Signal sao(t) entspricht 
dem Schallsignal innerhalb desjenigen Raumbereichs, der durch die 

15 Zuordnungsfunktion Z(S) und den Winkel So definiert ist. Der Einfachheit halber wird 
in der gewahlten Nomenklatur fur verschiedene Signalgeneratoren nur von einer 
Zuordnungsfunktion Z(S) ausgegangen, verschiedene Signalgeneratoren benutzen 
lediglich verschiedene Winkel S 0 . Praktisch spricht natiirlich nichts dagegen, in 
jedem Signalgenerator auch eine eigene Form der Zuordnungsfunktion zu wahlen. 

20 Die Anwendung von Zuordnungsfunktionen, welche Qber die Zugehorigkeit von 
Signalkomponenten zu verschiedenen Raumbereichen entscheiden, ist einer der 
^fc zentralen Gedanken der Erfindung. Eine Zuordnungsfunktion muss eine gerade 
^^Funktion sein, geeignete Funktionen sind z.B. Z(3)=((1 +cosS)/2) n mit einem 
Parameter n>0. Der Raumbereich, in welchem Signale mit weniger als 3db gedampft 

25 werden, entspricht einer Hyperbel mit Offnungswinkel 2y 3 db (Fig. 3) und Scheitel bei 
dem Winkel & 0 . Hierbei entspricht 2y 3d b dem Halbwertswinkel der 
Zuordnungsfunktion Z(&) (Fig. 2), mit der angegebenen Formel fQr die 
Zuordnungsfunktion gilt y 3d b=arc cos(2 1 ' 1/n -1 ). Bei diesen zweidimensionalen 
geometrischen Clberiegungen ist zu beachten, dass der tatsachliche Bereich des 

30 dreidimensionalen Raums, aus welchem mit dem beschriebenen Verfahren 
Schallsignale extrahiert werden, ein Rotationshyperboloid ist, der durch Rotation der 
beschriebene Hyperbel urn die Mikrofonachse entsteht. 
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Selbstverstandlich ist die vorliegende Erfindung nicht auf den Einsatz in 
Kraftfahrzeugen und Freisprecheinrichtungen beschrankt: Weitere Anwendungen 
sind Konferenz-Telefonanlagen, bei denen mehrere Richthyperbeln in verschiedene 
' 5 Raumrichtungen gelegt werden, urn die Sprachsignale einzelner Personen zu 
extrahieren und RQckkopplungen bzw. Echo-Effekte zu vermeiden. Des weiteren 
lasst sich das Verfahren mit einer Kamera kombinieren, wobei die Richthyperbel 
stets in die gleiche Richtung blickt wie die Kamera, und so nur aus dem Bildbereich 
kommende Schallsignale aufgezeichnet werden. In Bildtelefonsystemen ist mit der 
10 Kamera zugleich ein Monitor verbunden, in den die Mikrofonanordnung ebenfalls 
singebaut werden kann, urn eine Richthyperbel senkrecht zur Monitor-Oberflache zu 
fenerieren, denn es ist zu erwarten, dass sich der Sprecher vor dem Monitor 
befindet. 

15 Eine ganz andere Klasse von Anwendungen ergibt sich, wenn man anstatt 

des auszugebenden Signals den ermittelten Einfallswinkel S auswertet, indem man 
z.B. zu einem Zeitpunkt T Ober Frequenzen f mittelt. Ein solche »(T)-Auswertung 
kann zu Oberwachungszwecken benutzt werden, wenn innerhalb eines ansonsten 
ruhigen Raums die Position einer Schallquelle geortet werden soli. 

20 

Das richtige "Ausschneiden" des gewGnschten Bereichs entsprechend 
dem zu separierenden Nutz-Schallsignal aus einem Mikrofonspektrum muss nicht, 
wie in Figur 6 beispielhaft gezeigt, durch Multiplikation mit einer Filterfunktion 
erfolgen, deren Zuordnungsfunktion den in Figur 2 gezeigten beispielhaften Veriauf 
25 hat. Jede andere Art der Verknupfung des Mikrofonspektrums mit einer Filterfunktion 
ist geeignet, solange diese Filterfunktion und diese Verknupfung dazu fUhren, dass 
Werte im Mikrofonspektrum umso starker "gedampft" werden, je weiter ihr 
zugeordneter Einfallswinkel S vom bevorzugten Einfallswinkel S 0 (beispielsweise der 
Richtung des Fahrers im Kraftfahrzeug) entfernt ist. 
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Bezugszeichenliste: 

10 Rechenwerk zur DurchfGhrung der erfindungsgemalJen 

Verfahrensschritte 
20 Stereo-Abtast- und -Fourier-Transformator-Einheit 
30 a-Berechnungseinheit 
40 Signalgenerator 

a Anzahl der Abtastwerte, die zu Spektren M1 bzw. M2 transformiert 

werden 
d Mikrofonabstand 

D Diffusionskonstante, wahlbarer Parameter grofter oder gleich Null 

A 2 f Diffusionsoperator 

f Frequenz 

f A Abtastrate 

K1 erste Korrekturfunktion 

K2 zweite Korrekturfunktion 

ml (t) Zeitsignal des ersten Mikrofons 

m2(t) Zeitsignal des zweiten Mikrofons 

M1 (f,T) Spektrum zum Zeitpunkt T des ersten Mikrofonsignals 

M2(f,T) Spektrum zum Zeitpunkt T des zweiten Mikrofonsignals 

M(f ,t) Spektrum zum Zeitpunkt T des korrigierten Mikrofonsignals 

sao(t) erzeugtes Zeitsignal, entsprechend einem Winkel $ 0 der 

Richthyperbel 
Sso(f,T) Spektrum des Signals s&o(t) 

Y3db Winkel, welcher die Halbwertsbreite einer Zuordnungsfunktion 
Z($) bestimmt 

cp Phasenwinkel des komplexen Quotienten M2/M1 
S(f,T) Einfallswinkel einer Signalkomponente, gemessen von der 
Mikrofonachse 

d 0 Winkel des Scheitels einer Richthyperbel, Parameter in Z(S-& 0 ) 
x, x1 ZwischengrSfien bei der S-Berechnung 
t Zeitbasis der Signalabtastung 
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T Zeitbasis der Spektrumerzeugung 
Z(&) Zuordnungsfunktion 
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Anspriiche 

1. Verfahren zur Separierung von Schallsignalen von einer Mehrzahl 
von Schallquellen (S1, S2), umfassend die Schritte: 
5 - Anordnen von zwei Mikrofonen (MIK1, MIK2) in einem vorbestimmten 

Abstand (d) zueinander, 

- Erfassen der Schallsignale mit beiden Mikrofonen (MIK1, MIK2) und 
Erzeugen zugeordneter Mikrofonsignale (ml , m2); und 

- Separieren des Schallsignals einer der Schallquellen (S1) von den 
10 Schallsignalen der anderen Schallquellen (S2) basierend auf den 

Mikrofonsignalen (ml, m2), 
dadurch gekennzeichnet, dass der Schritt des Separierens ferner die 

Schritte umfafit: 

- Fourier-Transformieren der Mikrofonsignale zur Ermittlung ihrer 
15 Frequenzspektren (M1, M2); 

- Bestimmen der Phasendifferenz (q>) zwischen den beiden 
Mikrofonsignalen (ml, m2) fur jede Frequenzkomponente ihrer 
Frequenzspektren (M1, M2); 

- Bestimmen des Einfallswinkels (S) jedes einer Frequenz der 
20 Frequenzspektren (M1, M2) zugeordneten Schallsignals basierend auf 

der Phasendifferenz (9) und der Frequenz; 

- Erzeugen eines Signalspektrums (S) eines auszugebenden Signals 
durch Verknupfen eines der beiden Frequenzspektren (M1, M2) mit 
einer Filterfunktion (F s0 ), die derart gewahlt ist, dass Schallsignale aus 
einer Umgebung (yaae) urn einen bevorzugten Einfallswinkel (So) herum 
relativ zu Schallsignalen von aulierhalb dieser Umgebung (yscib) 

verstarkt werden; und 

- inverses Fourier-Transformieren des derart erzeugten Signalspektrums. 




25 



30 



2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
Filterfunktion (F 90 ) S-abhangig ist und unter Variation von 3 ein Maximum bei dem 
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bevorzugten Einfallswinkel (So) aufweist, und die VerknOpfung der Filterfunktion (F s0 ) 
mit einem der beiden Frequenzspektren eine Multiplikation derselben umfasst. 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die 
5 Filterfunktion (F s0 ) die Form aufweist: 

F so (f,T)=Z(S-» 0 )+ DA 2 f Z(S-So) 

wobei 

f die jeweilige Frequenz 

T der Zeitpunkt der Ermittlung der Frequenzspektren (M1 , M2) 
10 Z(&-$o) eine Zuordnungsfunktion mit Maximum bei &o 

D > 0 eine Diffusionskonstante, und 
A 2 f ein diskreter Diffusionsoperator ist. 

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die 

15 Zuordnungsfunktion (Z) die Form aufweist: 

f1 +cos(S-S 0 ) Y 
2 J 




z(&-3 0 ) = 

wobei n > 0 ist. 




5. Verfahren nach einem der Anspriiche 1 bis 4, dadurch 
20_ gekennzeichnet, dass die Bestimmung des Einfallswinkels S tiber die Beziehung 

3=arc cos(x(f,T)) 

erfolgt mit 

x(f,T)= <pc/27tfd 

wobei 

25 9 die Phasendifferenz zwischen den beiden Mikrofonsignalkomponenten 

(ml , m2) 

c die Schallgeschwindigkeit 

f die Frequenz der Schallsignalkomponente und 

d der vorbestimmte Abstand der beiden Mikrofone (MIK1 , MIK2) ist. 



6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass es ferner 
den Schritt umfasst: 

Begrenzen des Werts von x(f,T) auf das Intervall [-1 , 1]. 



7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass es ferner 
den Schritt umfasst: 

Reduzieren von Signalkomponenten, fQr die der Wert von x(f,T) vor der 
Begrenzung auRerhalb des Intervalls [-1, 1] lag. 

8. Vorrichtung zur Durchfuhrung des Verfahrens nach einem der 
Anspriiche 1 bis 7, umfassend: 

J - zweiMikrofone(M!K1, MIK2); 

- eine an die Mikrofone angeschlossene Abtast- und Fourier- 
Transformationseinheit (20) zum Diskretisieren, Digitalisieren und 
Fourier-Transformieren der Mikrofonsignale (ml, m2); 

- eine an die Abtast- und Fourier-Transformationseinheit (20) 
angeschlossene Berechnungseinheit (30) zur Berechnung des 
Einfallswinkels (3) jeder Schallsignalkomponente; und 

- wenigstens einen an die Berechnungseinheit (30) angeschlossenen 
Signalgenerator (40) zur Ausgabe des separierten Schallsignals. 

9. Vorrichtung nach Anspruch 8, dadurch gekennzeichnet, dass der 
lAbstand (d) zwischen den Mikrofonen der Relation genQgt: 

d<c/4f A 

wobei c die Schallgeschwindigkeit und f A die Abtastfrequenz der Abtast- 
und Fourier-Transformationseinheit (20) 1st. 

10. Vorrichtung nach Anspruch 8 oder 9, dadurch gekennzeichnet, dass 
die Vorrichtung fOr jede zu separierende Schallquelle (S1, S2) einen Signalgenerator 
(40) umfafit. 
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Zusammenfassung 

Bei einem Verfahren zur Separierung von Schallsignalen von einer 
Mehrzahl von Schallquellen, umfassend die Schritte 
• 5 - Anordnen von zwei Mikrofonen (MIK1, MIK2) in einem vorbestimmten 

Abstand (d) zueinander; 

- Erfassen der Schallsignale mit beiden Mikrofonen (MIK1, MIK2) und 
Erzeugen zugeordneter Mikrofonsignale (ml , m2); und 

- Separieren des Schallsignals einer der Schallquellen (S1) von den 
10 Schallsignalen der anderen Schallquellen (S2) basierend auf den 

Mikrofonausgangssignalen (ml, m2), 
6 Bwird vorgeschlagen, dass der Schritt des Separierens umfallt: 

- Fourier-Transformieren der Mikrofonausgangssignale zur Ermittlung 
ihrer Frequenzspektren (M1 , M2); 

15 - Bestimmen der Phasendifferenz (cp) zwischen den beiden 

Mikrofonausgangssignalen (ml, m2) fQr jede Frequenzkomponente 
ihrer Frequenzspektren (M1, M2); 

- Bestimmen des Einfallswinkels (S) jedes einer Frequenz der 
Frequenzspektren (M1, M2) zugeordneten Schallsignals basierend auf 

20 dem relativen Phasenwinkel (<p) und der Frequenz; 

- Erzeugen eines Signalspektrums (S) eines auszugebenden Signals 
durch VerknQpfen eines der beiden Frequenzspektren (M1, M2) mit 
einer Filterfunktion (F so ), die derart gewahlt ist, dass Schallsignale aus 
einer Umgebung (yscib) urn einen bevorzugten Einfallswinkel (d 0 ) herum 

25 relativ zu Schallsignalen von auBerhalb dieser Umgebung (y 3 dB) 

verstarkt werden; und 

- inverses Fourier-Transformieren des derart erzeugten Signalspektrums. 
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